Validation d'une méthodologie pour l'étude des marqueurs de la segmentation dans un grand corpus de textes
نویسندگان
چکیده
This research aims at validating a methodology for the study of segmentation markers in large corpora. Two indices signalling a thematic break in a text are proposed. The first is based on the presence of a paragraph mark and employs the odds ratio to identify the best markers. The second takes into account lexical cohesion between sentences via an index resulting from latent semantic analysis. These two indices were applied mainly to the study of temporal adverbial expressions in literary texts. The analyses carried out confirm a series of linguistic hypotheses about the segmentation function of temporal adverbials. MOTS-CLÉS : marqueurs de segmentation, adverbiaux temporels, paragraphe, analyse sémantique latente, expressions référentielles.
منابع مشابه
Marqueurs de la relation cause-effet : stabilité et variation dans des corpus de nature différente
Résumé : Les marqueurs lexicaux figurent parmi les indicateurs les plus intéressants pour identifier et classer finement des relations terminologiques. Cependant, l’exploitation des marqueurs pour repérer automatiquement ou semi-automatiquement les relations dans des corpus, notamment des corpus associés à des domaines ou à des genres textuels différents, peut soulever des problèmes. Le présent...
متن کاملUn système de vote pour la classification de textes d'opinion
La classification de textes a pour objectif le regroupement de documents selon différents critères. Dans les travaux présentés dans cet article, nous nous intéressons à la classification de textes d'opinion qui consiste à classer les textes selon un jugement tel que l'aspect positif ou négatif d'une critique, l'aspect favorable ou défavorable donné par un expert, etc. Nous proposons dans cet ar...
متن کاملفایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کاملReconnaissance automatique de concepts à partir d'une ontologie
Résumé Ce papier présente une approche qui s’appuie sur une ontologie pour reconnaître automatiquement des concepts spécifiques à un domaine dans un corpus en langue naturelle. La solution proposée est non-supervisée et peut s’appliquer à tout domaine pour lequel une ontologie a été déjà construite. Un corpus du domaine est utilisé dans lequel les concepts seront reconnus. Dans une première pha...
متن کاملConstruction d'une ontologie du domaine HSE
Résumé : Dans cet article, nous présentons un travail de construction d’une ontologie du domaine de la réglementation Hygiène-Sécurité-Environnement (HSE) concernant les installations industrielles. Ce travail a été mené selon deux approches : l’utilisation de nomenclatures et d’interviews d’experts du domaine pour aider à la compréhension des notions du domaine et à leur conceptualisation et l...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- TAL
دوره 47 شماره
صفحات -
تاریخ انتشار 2006